データサイエンス



今回の課題では、「住みやすいエリアをデータ分析で紹介」と言うことで、渡されたデータの中にある '名称', 'カテゴリー', 'アドレス', 'アクセス', '路線','駅', 'バス停', '乗換時間', 'バス', '徒歩', '車', '合計時間', '築年数','構造', '階数', '家賃', '管理費', '敷金', '礼金', '間取り', '面積' の21項目の中から「合計時間」「路線」「家賃」に注目して分析してみた。




上位12組を算出し、みなとみらい線が一番、東急東横線が2番目に乗車合計時間が長かった。


そこから、家賃が安い上位12駅を出し、1位が五反田駅、2位が調布駅。


これらの結果から、「みなとみらい線は高い」と言う理由でみなとみらい線を勝手ながら省かせてもらった。

それに加え、神大生(横浜キャンパス)の平均家賃は50,680円であるというデータがある。
※このサイトより参照→神奈川大学(横浜キャンパス)家賃相場・平均家賃や平均通学時間 最新版|学生マンション・学生賃貸なら学生ウォーカー

また、「五反田は治安が悪い」という話を多くの人から聞いたので省こうと考えたが、「ランドワーク不動産」さんのサイトより、
五反田が位置する品川区は他の区に比べて犯罪件数が1.5~2倍ほど低かった。
五反田で一人暮らし!相場は?治安や街の雰囲気は?実際住んでる人の声も紹介!(ランドワーク不動産)

このことからも五反田自体は安全なようにも思えてしまう。
しかし、当然不安に思う人たちもいるだろう。一人暮らしの女性は特に不安だろう。
そんな人たちには2番目に家賃の安い「調布駅」をお勧めしようと思う。

これらのことから、五反田をまずはお勧めし、治安に不安を感じる人の場合は調布駅が一番良いのではないかと考えた。

結論:まずは五反田周辺をお勧めする


※五反田駅と調布駅場所めっちゃ離れてるけど💦

加えて、先生からは許可していただけたからよかったものの、おすすめするエリアの範囲を誤認してたことをプレゼンが終わって知りました。
ので、今回お薦めしたものは「学生生活満喫」したい人向けであると捉えていただけると幸いです。




ソースコード↓
  1. import pandas as pd
  2. import matplotlib.pyplot as plt
  3. pd.set_option('display.unicode.east_asian_width', True)
  4. plt.rcParams['font.family'] = 'IPAexGothic'
  5. plt.rcParams['font.size']=9
  6. data_path = "data.csv"
  7. df_data = pd.read_csv(data_path, encoding="utf-8-sig")
  8. print(df_data.columns)
  9. print(df_data["合計時間"].describe())
  10. print(df_data.groupby("路線").mean().loc[:,"合計時間"].sort_values()[:12])
  11. df_data.groupby("路線").mean().loc[:,"合計時間"].sort_values()[:12].plot.bar(figsize = (12, 8))
  12. plt.subplots_adjust(left=0.02, right=0.98,bottom=0.3)
  13. plt.show()
  14. print(df_data.groupby("路線").mean().loc[:,"家賃"].sort_values()[:12])
  15. df_data.groupby("駅").mean().loc[:,"家賃"].sort_values()[:12].plot.bar(figsize = (12, 8))
  16. plt.subplots_adjust(left=0.02, right=0.98,bottom=0.3)
  17. plt.show()